查看原文
其他

【自然资源一体化“新”架构】你get到“业务数据治理”了吗?

DIST DIST上海数慧 2022-07-25

点击蓝字关注我们


自然资源行业已经建立了空间数据处理和治理的习惯,随着行业的发展、治理能力和管理要求的提升,业务数据治理工作的重要性越来越凸显,尤其是随着业务融合、技术演进和应用系统的增加,其复杂性和难度不断加大,已经成为一项充满挑战的任务。

以某自然资源局为例,由于组织变动,导致存在四个版本的业务审批系统(从最早的97版本一直到2006年版本)。汇总后,其业务数据涉及13个库,共1400多张表,16651个字段。其中,政务数据涉及4个库,有1.7TB;业务数据涉及7个库,共50GB;对外发布数据涉及2个库,共107GB。这些业务数据存在异构多源、一数多源,由不同承建单位在不同时期设计开发,数据标准不统一,数据质量不一致,同词不同义、同义不同词等诸多问题,影响办理效率和质量。对于这些数据,亟需理清数据的来龙去脉,去伪存真,用于快速支撑业务办理、提质增效。



通过上面这样一个例子,相信大家能了解到业务数据治理的重要性和紧迫感了。为了更好的做好业务数据治理这项工作,小编先带领大家认识一下业务数据和空间数据的不同以及治理的差异性,再和大家分享业务数据治理的步骤和方法。



业务数据和空间数据的不同之处


数据组织不同

01

空间数据以空间索引来组织数据。比如,对于控制性详细规划的用地规划图层,可采用地块作为空间索引,容积率、绿地率、建筑密度等信息作为属性数据。业务数据通常以业务域、事项或项目来组织数据,可分解为表单、指标和附件材料等信息。对于需要关联空间位置的业务数据,关联相应的空间位置即可。

数据建模不同

02

空间数据库大多采用地理信息系统(GIS)技术建模,其建模方式主要受地理空间规则约束。业务数据形式多样,所采用的建模技术更加灵活,理论上大多遵从实体-关系(ER)模型,但在实践中不同数据库厂商或流派采用的方法和工具都不尽相同,给数据建模带来更多困难。很多业务系统运行上线后,系统模型需要不断做出调整。

应用视角不同

03

空间数据通常从空间关系展示和空间分析作为应用出发点。所谓“一张图胜过千言万语” “80%以上的人类活动与空间位置息息相关”,通过空间数据的展现和分析,可以更容易地从全局的、中观或宏观的角度理解和使用数据资源。总体而言,空间数据更加适合管理人员作为决策使用。例如,通过空间统计分析,可以得到某个区域的土地利用情况,并以电子地图方式直观地展现出来。业务数据往往从“事物”或“事项”的角度出发,反映事物的细节或事项的具体进展。例如,在办理各类许可证时,会产生或利用大量的业务数据。可见,业务数据的应用偏中微观,一般面向内部业务人员、外部企事业单位或社会公众。

变化频率不同

04

在自然资源领域,其空间数据通常包含基础地理数据、规划编制数据以及管理数据,其中基础地理数据作为空间底图,根据变更调查等内容进行周期性更新,规划编制数据则以修编和规划调整进行更新。自然资源领域的业务数据需要根据新的政策要求、组织机构变革、业务流程调整、管理规章改变,甚至人事调整变化等实时变化。



认识到业务数据和空间数据的不同之处后,小编再来带领大家一起探讨业务数据治理和空间数据治理的不同点。



业务数据治理和空间数据治理的差异性分析


01

数据治理内容不同


空间数据大多以空间关系治理为主、属性数据为辅。比如地块边界线不闭合、覆盖叠加、缺失属性等,都需要加以规整。通过规整,建立起正确的空间要素之间的关系(拓扑关系)。业务数据则通常根据业务规则来判断数据的现势性、是否重复、是否超界等。通过数据治理,建立起数据之间的关联关系,业务数据治理的范围更加广泛,涉及的技术和手段可能更为复杂。

02

处理方式不同


由于存在复杂的空间关系,空间数据处理主要采用“软件工具+人工交互”的方式为主,难以实现完全的自动化,很多处理离不开人工判断。比如:将CAD数据转化到ArcSDE空间数据库中,需要有专门的转换工具,通常通过人工来实现转换入库;业务数据由于采用的技术和模型不一样,针对不同的业务库很难有统一的数据处理工具,需要对业务知识、业务规则有充分了解的前提下,编写专门的数据处理工具。对于采用关系数据模型的业务数据,数据实体之间符合严格的关系代数,在编写出数据处理程序后,通常可以自动化执行,人工干预较少。因此,在治理方式上,两者的难点和方式都有所不同。

03

治理范围不同


如前所述,自然资源领域的空间数据相对稳定,关键是把好源头质量关,后续变化后及时更新即可。因此其治理更多地考虑数据质检、更新和入库等前端环节。业务数据受业务变动的影响大,要考虑全程治理,包括其顶层设计、需求分析、模型设计、开发实现、运维变更、共享交换等全生命周期。

04

工程化程度不同


自然资源与空间位置息息相关,全行业在空间数据治理和应用方面投入较大,经过几十年的发展,针对自然资源的空间数据治理工艺流程已经比较成熟,工程化程度较高。而规划自然资源领域的业务数据,以往多附着在空间数据上,很少独立治理。再加上自然资源部门成立后,所带来的业务多样性,使得数据治理更加复杂困难。因此,就当前发展阶段而言,自然资源领域的业务数据治理存在很多困难和白区,需要专门对待,其工艺流程也有待不断迭代完善。


如上可见,自然资源行业的业务数据治理变得非常重要,那么通过什么方法或步骤,怎么治理,才能让数据价值再利用,用数据驱动业务创新。基于上述原因,上海数慧建立专门的业务数据治理团队积极探索业务数据治理的过程,通过将基本的数据治理原则、方法和过程与自然资源领域相结合,形成具有行业特色的业务数据治理框架,总结行业数据规律,发现数据核心价值。敬请关注下篇:《自然资源业务数据治理的七步战法》




 系列专题  


业务、数据和应用的全面整合,促进自然资源一体化走向微服务架构

当微服务“遇见”自然资源一体化时,必须回答好的五个问题

基于微服务的自然资源一体化中台新架构

自然资源多源异构应用系统和数据的整合技术

你get到“业务数据治理”了吗?

自然资源业务数据治理的七步战法




点“在看”给我一朵小黄花

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存